智能论文笔记

Domain Adapting Deep Reinforcement Learning for Real-world Speech Emotion Recognition

Thejan Rajapakshe , Rajib Rana , Sara Khalifa , Bjorn W. Schuller

分类：机器学习

2022-07-07

得益于语音情绪识别（SER），计算机可以以情感智能的方式理解并与人互动。但是，可以显着改善SER在交叉和现实世界中的实时数据供稿方案中的性能。无法将现有模型调整到新域是SER方法的缺点之一。为了应对这一挑战，研究人员开发了域的适应技术，这些技术转移了模型在整个领域中学习的知识。尽管现有的域适应技术已经改善了跨域的性能，但可以改进它们以适应现实世界中的实时数据提要情况，在这种情况下，模型可以在部署时可以自动调整。在本文中，我们提出了一种基于强化的学习策略（RL-DA），用于在与环境互动并收集持续反馈的同时，将预训练的模型调整为现实世界中的实时数据供稿设置。 RL-DA对SER任务进行了评估，包括跨语言和跨语言域自适应模式。评估结果表明，在实时数据供稿设置中，RL-DA在跨科普斯和跨语言场景中的基线策略分别优于基线策略。

translated by 谷歌翻译